Si l'on effectue un tirage au sort (avec remise) dans une urne contenant une proportion $p=0,4$ de boules blanches, il y a de grande chances de tirer environ $40%$ de boules blanches.
Ca n'est généralement vrai, que si l'on effectue un nombre $n$ significativement important de tirages.
Il est possible de prouver que dans des conditions particulières, la proportion correspondra environ à $40%$ dans $95%$ des cas. C'est ce qu'exprime l'intervalle de fluctuation asymptotique.
Soient $p$ la proportion connue, $n$ le nombre de tirage, et $f$ la fréquence effective (observée).
Si $n \geq 30$, $n p \geq 5$ et $n (1-p)\geq 5$, alors :
$f$ est dans l'intervalle $[p - 1,96\frac{\sqrt{p (1-p)}}{\sqrt{n}}, p + 1,96\frac{\sqrt{p (1-p)}}{\sqrt{n}}]$ avec une probabilité de $0,95$
La proportion $p$ d'enfants prématurés en France est de $6\%$. Des chercheurs font l'hypothèse qu'une femme ayant eu un travail pénible pendant sa grossesse a plus de chance d'avoir un enfant prématuré.
Ils réalisent une enquête sur $n=400$ femmes ayant eu un travail pénible pendant leur grossesse.
Dans cet échantillon, $50$ femmes ont eu des prématurés.
$I = [p - 1,96\frac{\sqrt{p (1-p)}}{\sqrt{n}}, p + 1,96\frac{\sqrt{p (1-p)}}{\sqrt{n}}] \simeq [0,037;0,083]$
Les conditions $n =400 \geq 30$, $n p = 24 \geq 5$ et $n (1-p) = 376 \geq 5$ sont satisfaites, donc l'échantillon est significatif.
Lorsqu'une étude statistique déclare que 35% des français préfèrent la montagne à la plage, il s'agit d'une fréquence ($p=0,35$) estimée, mais que l'on ne connaît pas réellement (il est impossible d'interroger tous les français).
On peut prouver mathématiquement que cette statistique est fiable à 95% si on a interrogé un échantillon de $n$ français suffisemment grand.
Cet outil mathématique est l'intervalle de confiance 0,95.
Soient $f$ la fréquence observée, $n$ la taille d'un échantillon et $p$ la fréquence réelle (inconnue).
Si $n \geq 30$, $n f \geq 5$ et $n (1-f)\geq 5$, alors :
$p$ est dans l'intervalle $[f - \frac{1}{\sqrt{n}}, f + \frac{1}{\sqrt{n}}]$ avec une probabilité de $0,95$
Un médecin veut tester un traitement. Il expérimente sur deux groupes de malades ayant la même pathologie.
Pour le groupe A l'intervalle est $[f_A - \frac{1}{\sqrt{n}},f_A + \frac{1}{\sqrt{n}}] \simeq [0,73;0,89]$
Pour le groupe B l'intervalle est $[f_B - \frac{1}{\sqrt{n}},f_B + \frac{1}{\sqrt{n}}] \simeq [0,55;0,71]$